智能论文笔记

On the Privacy Risks of Deploying Recurrent Neural Networks in Machine Learning

Yunhao Yang , Parham Gohari , Ufuk Topcu

分类：人工智能

2021-10-06

我们研究在机器学习模型中部署经常性神经网络（RNNS）的隐私含义。我们专注于一类隐私威胁，称为会员推理攻击（MIAS），其旨在推断是否已用于培训模型的特定数据记录。考虑到三台机器学习应用，即机器翻译，深度加固学习和图像分类，我们提供了经验证据，即RNN比偏置更容易受到偏置的偏移架构。然后，我们研究差异隐私方法，以保护RNN的培训数据集的隐私。众所周知，这些方法提供了严谨的隐私，而不管对抗的模型如何保证。我们为所谓的DP-FedAVG算法开发替代差异隐私机制，而不是在训练期间混淆渐变，使模型的输出组合。与现有的工作不同，该机制允许培训隐私参数的后期调整，而无需重新培训模型。我们提供数值结果，表明该机制为米西亚提供了强烈的盾牌，同时交易边际效用。

translated by 谷歌翻译

Universal Feature Selection Tool (UniFeat): An Open-Source Tool for Dimensionality Reduction

Sina Tabakhi , Parham Moradi

分类：机器学习 | 人工智能 | (统计)机器学习

2022-11-30

The Universal Feature Selection Tool (UniFeat) is an open-source tool developed entirely in Java for performing feature selection processes in various research areas. It provides a set of well-known and advanced feature selection methods within its significant auxiliary tools. This allows users to compare the performance of feature selection methods. Moreover, due to the open-source nature of UniFeat, researchers can use and modify it in their research, which facilitates the rapid development of new feature selection algorithms.

translated by 谷歌翻译

Exploring Gradient-based Multi-directional Controls in GANs

Zikun Chen , Ruowei Jiang , Brendan Duke , Han Zhao , Parham Aarabi

分类：计算机视觉

2022-09-01

生成对抗网络（GAN）已广泛应用于建模各种图像分布。然而，尽管具有令人印象深刻的应用，但甘恩（Gans）中潜在空间的结构在很大程度上仍然是一个黑框，使其可控的一代问题是一个开放的问题，尤其是当图像分布中存在不同语义属性之间的虚假相关性时。为了解决此问题，以前的方法通常会学习控制图像空间中语义属性的线性方向或单个通道。但是，他们通常会遭受不完美的分解，或者无法获得多向控制。在这项工作中，根据上述挑战，我们提出了一种新的方法，可以发现非线性控件，该方法基于学识渊博的gan潜在空间中的梯度信息，可以实现多个方向的操作以及有效的分解。更具体地说，我们首先通过从对属性分别训练的分类网络中遵循梯度来学习插值方向，然后通过专门控制针对目标属性在学习的方向上激活目标属性的通道来导航潜在空间。从经验上讲，借助小型培训数据，我们的方法能够获得对各种双向和多方向属性的细粒度控制，并且我们展示了其实现分离的能力，其能力明显优于先进方法。定性和定量。

translated by 谷歌翻译

Supermodular $\mf$-divergences and bounds on lossy compression and generalization error with mutual $\mf$-information

Saeed Masiha , Amin Gohari , Mohammad Hossein Yassaee

分类：机器学习

2022-06-21

在本文中，我们介绍了超模块化$ \ mf $ -Diverences，并为它们提供了三个应用程序：（i）我们在基于超模型$ \ MF $ - 基于独立随机变量的尾部引入了Sanov的上限。分歧并表明我们的广义萨诺夫（Sanov）严格改善了普通的界限，（ii）我们考虑了有损耗的压缩问题，该问题研究了给定失真和代码长度的一组可实现的速率。我们使用互助$ \ mf $ - 信息扩展了利率 - 延伸函数，并使用超模块化$ \ mf $ -Diverences在有限的区块长度方面提供了新的，严格的更好的界限，并且（iii）我们提供了连接具有有限输入/输出共同$ \ mf $的算法的概括误差和广义率延伸问题。该连接使我们能够使用速率函数的下限来限制学习算法的概括误差。我们的界限是基于对利率延伸函数的新下限，该函数（对于某些示例）严格改善了以前最著名的界限。此外，使用超模块化$ \ mf $ -Divergences来减少问题的尺寸并获得单字母界限。

translated by 谷歌翻译

Rate-Distortion Theoretic Generalization Bounds for Stochastic Learning Algorithms

Milad Sefidgaran , Amin Gohari , Gaël Richard , Umut Şimşekli

分类： (统计)机器学习 | 机器学习

2022-03-04

了解现代机器学习设置中的概括一直是统计学习理论的主要挑战之一。在这种情况下，近年来见证了各种泛化范围的发展，表明了不同的复杂性概念，例如数据样本和算法输出之间的相互信息，假设空间的可压缩性以及假设空间的分形维度。尽管这些界限从不同角度照亮了手头的问题，但它们建议的复杂性概念似乎似乎无关，从而限制了它们的高级影响。在这项研究中，我们通过速率理论的镜头证明了新的概括界定，并明确地将相互信息，可压缩性和分形维度的概念联系起来。我们的方法包括（i）通过使用源编码概念来定义可压缩性的广义概念，（ii）表明“压缩错误率”可以与预期和高概率相关。我们表明，在“无损压缩”设置中，我们恢复并改善了现有的基于信息的界限，而“有损压缩”方案使我们能够将概括与速率延伸维度联系起来，这是分形维度的特定概念。我们的结果为概括带来了更统一的观点，并打开了几个未来的研究方向。

translated by 谷歌翻译